Главная arrow книги arrow Копия Глава 23. arrow Статистический машинный перевод
Статистический машинный перевод

Проблему перевода английского предложения Е, скажем, во французское предложение F можно представить в виде следующего уравнения, предусматривающего применение правила Байеса:

Это правило указывает, что мы должны рассмотреть все возможные французские предложения F и выбрать из них то, которое максимизирует произведение Р(Е\ F) P(F). Коэффициент Р{Е) можно проигнорировать, поскольку он является одинаковым для любого F. Коэффициент Ρ (F) представляет собой языковую модель для французского языка; он указывает, насколько велика вероятность появления данного конкретного предложения во французском тексте. Вероятность p[e\f) представляет собой модель перевода; она указывает, насколько велика вероятность того, что некоторое английское предложение будет использоваться в качестве перевода, если дано определенное французское предложение.

Внимательного читателя, безусловно, заинтересует вопрос о том, чего мы добьемся, определив вероятность p(f\e) в терминах Р(Е\ F). В других областях применения правила Байеса такая перестановка термов в выражениях для условной вероятности была сделана в связи с тем, что мы стремились перейти к использованию причинной модели. Например, для вычисления вероятности наличия определенных симптомов при определенном заболевании, Ρ(Disease \ Symptoms), применялась причинная модель Ρ(Symptoms \ Disease). В отличие от этого при переводе с одного языка на другой ни одно из направлений перевода не характеризуется большей причинной зависимостью, чем другое. В данном случае правило Байеса применяется в связи с тем, что мы, по-видимому, сможем легко определить с помощью обучения языковую модель P{F), которая является более точной по сравнению с моделью перевода p(E\f) (а также более точной по сравнению с непосредственно полученной оценкой p(f\e)). По сути такой подход позволяет разделить задачу на две части — вначале применить модель перевода p(f\E) для поиска подходящих французских предложений, в которых упоминаются те же понятия, что и в английском предложении (но это не обязательно должны быть французские предложения, полностью адекватные английскому предложению); затем воспользоваться языковой моделью P{F) (для которой имеются намного лучшие оценки вероятностей), чтобы выбрать наиболее подходящий вариант перевода.